Forwarded from Save The Web Project (yzqzss |一座桥在水上)
Media is too big
VIEW IN TELEGRAM
以「YLSBS 」为例的 BiliBili 存档操作教程🙈
所以真的没人对存档 BiliBili 感兴趣?😢🥲
所以真的没人对存档 BiliBili 感兴趣?😢🥲
Forwarded from Save The Web Project (yzqzss |一座桥在水上)
yzqzss|一座桥在水上's Note
Photo
草,刚看了 hd-idle 的日志,发现自 5 月 4 号后,我没一块硬盘停转过……
都是 scrutiny 惹的锅,它读 smartctl 会使硬盘唤醒……
我实测先手动停转,然后跑 scrutiny,然后硬盘一个接一个地起飞了……
GitHub issue 上看到有些人用 scrutiny ,但是没影响到硬盘休眠。(然后甚至让 scrutiny 出了 BUG https://github.com/AnalogJ/scrutiny/issues/157 )
但是至少在我这儿,确实 scrutiny 影响了。
如果 scrutiny 可以在访问 smart 数据之前用 smartctl -in standy 查一下硬盘电源状态就好了……
都是 scrutiny 惹的锅,它读 smartctl 会使硬盘唤醒……
我实测先手动停转,然后跑 scrutiny,然后硬盘一个接一个地起飞了……
GitHub issue 上看到有些人用 scrutiny ,但是没影响到硬盘休眠。(然后甚至让 scrutiny 出了 BUG https://github.com/AnalogJ/scrutiny/issues/157 )
但是至少在我这儿,确实 scrutiny 影响了。
如果 scrutiny 可以在访问 smart 数据之前用 smartctl -in standy 查一下硬盘电源状态就好了……
GitHub
[Standby-Support][BUG] Disks in standby mode are not correctly processed/detected - Scrutiny will create a duplicate disk with…
Describe the bug I installed scrutiny through the linuxserver docker container on a raspberry pi 4 to which I have attached two disks by USB connection. When running for the first time scrutiny scr...
接下来 #回忆 还会更新:
#轮胎作为玩具
#铁环
#站得高也就骂得远
#死去的猫
#白天的烟花
#死去的和发臭的螃蟹
#地上的满天星
#两个让我走偏至今的“朋友”(怂恿偷盗、坐车不给钱、群架、夜不归家)
#王爷爷的火柴
#关于我的精神病大妈(长篇)
#屎从天降两则
#蜗牛红牛
#和猫猫一起爬墙
#从3到4楼高跳下
#浇花与弱电箱维修人员
#各种颜色的电线与弱电箱维修
#没人喜欢和我做朋友
#那些曾经对我有期望的老师
#稀释无数倍的水不甜
#幻想见到UFO与外星人
#看动画流泪
#鬼地方没WiFi
#老家的涵洞与我们的探险
#涵洞里的鬼火
#小轿车车长作为长度单位
#我不是薄熙来
#我不是马云
#改了学校_WiFi_SSID_和密码。
#爱哭?
#自尊心是什么?(我现在也不懂这个词的含义)
#写不出作文的我唯一一次把作文写成短篇小说
#各种地方放火
#人的冷漠是装出来的吗,沉进湖里的幼鸟
#舅妈公司的旺财
#注定分离且没有共同话题的人能成为朋友吗
#空调外机和锁门
#翻墙进幼儿园玩
#翻墙进别人家阳台玩
#翻墙用绿色VPN
#偷钱与捡垃圾与偷垃圾与自以为是
#不说话的爷爷
#重男轻女的外公外婆
#竹杆夹上轮子就是玩具
#爷爷死后
#我的婆婆是谁
#PS和FC
#暴走漫画与BiliBili
#天桥与哥差点杀人
#打到天上的水柱
#哥闭着眼睛走路
#直观感受BiliBili的流行
#别人带动画碟但我带故事碟
#水上飘与掷羽毛球与作弊与逃避
#游标卡尺的初始位移之它到底准不准
#记录频道和科教频道是最爱
#表姐是外星人
#我忘了我表姐是我表姐
#搬起的大石头不小心落向了……
#放火烧山两则
#成功和外婆家的一只患有自闭症的母鸡打好关系
#从3楼高放飞母鸡,观察飞行抛物线
#只有城里人才不知道苦瓜是甜的
#骨折的鸡只能被吃掉
#从1/3和 0.3333... 得出来的奇葩结论
#逃学
#装病
#积木与拼搭玩具也许是唯一的娱乐
#两天连续集中注意力忘乎所以只为了……
#一箱又一箱的牛奶
#还鸡蛋与扔鸡蛋
#把添加剂视为洪水猛兽的爸
#淘宝刷单
#把手机刷个颜色就看不出原样?
#害怕出家门的少女与我差点带坏他
#我以前也和她一样,什么时候变了?
#吹过的口风琴不是礼物
#总记不住人名
#未完成的字幕替换
#多种方法打开有锁的柜子
#一句很奇怪的放话
#爸妈离婚了
#用植物做的拱门还在吗
#探险停车场附一层与自己吓自己
#我喜欢的人和曼妥思
#还好不喜欢我了
#彩票店和挖矿软件
#城市中的野生兔子
#坐出租车忘带钱
#钢笔没有赔
#小卖部没有还钱
#得肺炎,写一篇完全没经历过的作文
#关于我开淘宝店的这些事
#一包辣条偷出一堆辣条
#去摆摊赚钱
#最早的记忆是动物园的老虎
#欠我钱的同学
#想偷我TF卡的同学
#不会泡面的同学
#下雨天与我和哥搭的草屋
#关于我提出“为什么女的不用做xx手术”的疑问和“炫耀”自己做过xx手术这件事
#黑暗躲猫猫
#以笑面对一切真的能解决问题
各位感兴趣的 tag 可以留言,我先写。把过去藏起来只会遗忘过去……
记录时间重点在高中以前。
#轮胎作为玩具
#铁环
#站得高也就骂得远
#死去的猫
#白天的烟花
#死去的和发臭的螃蟹
#地上的满天星
#两个让我走偏至今的“朋友”(怂恿偷盗、坐车不给钱、群架、夜不归家)
#王爷爷的火柴
#关于我的精神病大妈(长篇)
#屎从天降两则
#蜗牛红牛
#和猫猫一起爬墙
#从3到4楼高跳下
#浇花与弱电箱维修人员
#各种颜色的电线与弱电箱维修
#没人喜欢和我做朋友
#那些曾经对我有期望的老师
#稀释无数倍的水不甜
#幻想见到UFO与外星人
#看动画流泪
#鬼地方没WiFi
#老家的涵洞与我们的探险
#涵洞里的鬼火
#小轿车车长作为长度单位
#我不是薄熙来
#我不是马云
#改了学校_WiFi_SSID_和密码。
#爱哭?
#自尊心是什么?(我现在也不懂这个词的含义)
#写不出作文的我唯一一次把作文写成短篇小说
#各种地方放火
#人的冷漠是装出来的吗,沉进湖里的幼鸟
#舅妈公司的旺财
#注定分离且没有共同话题的人能成为朋友吗
#空调外机和锁门
#翻墙进幼儿园玩
#翻墙进别人家阳台玩
#翻墙用绿色VPN
#偷钱与捡垃圾与偷垃圾与自以为是
#不说话的爷爷
#重男轻女的外公外婆
#竹杆夹上轮子就是玩具
#爷爷死后
#我的婆婆是谁
#PS和FC
#暴走漫画与BiliBili
#天桥与哥差点杀人
#打到天上的水柱
#哥闭着眼睛走路
#直观感受BiliBili的流行
#别人带动画碟但我带故事碟
#水上飘与掷羽毛球与作弊与逃避
#游标卡尺的初始位移之它到底准不准
#记录频道和科教频道是最爱
#表姐是外星人
#我忘了我表姐是我表姐
#搬起的大石头不小心落向了……
#放火烧山两则
#成功和外婆家的一只患有自闭症的母鸡打好关系
#从3楼高放飞母鸡,观察飞行抛物线
#只有城里人才不知道苦瓜是甜的
#骨折的鸡只能被吃掉
#从1/3和 0.3333... 得出来的奇葩结论
#逃学
#装病
#积木与拼搭玩具也许是唯一的娱乐
#两天连续集中注意力忘乎所以只为了……
#一箱又一箱的牛奶
#还鸡蛋与扔鸡蛋
#把添加剂视为洪水猛兽的爸
#淘宝刷单
#把手机刷个颜色就看不出原样?
#害怕出家门的少女与我差点带坏他
#我以前也和她一样,什么时候变了?
#吹过的口风琴不是礼物
#总记不住人名
#未完成的字幕替换
#多种方法打开有锁的柜子
#一句很奇怪的放话
#爸妈离婚了
#用植物做的拱门还在吗
#探险停车场附一层与自己吓自己
#我喜欢的人和曼妥思
#还好不喜欢我了
#彩票店和挖矿软件
#城市中的野生兔子
#坐出租车忘带钱
#钢笔没有赔
#小卖部没有还钱
#得肺炎,写一篇完全没经历过的作文
#关于我开淘宝店的这些事
#一包辣条偷出一堆辣条
#去摆摊赚钱
#最早的记忆是动物园的老虎
#欠我钱的同学
#想偷我TF卡的同学
#不会泡面的同学
#下雨天与我和哥搭的草屋
#关于我提出“为什么女的不用做xx手术”的疑问和“炫耀”自己做过xx手术这件事
#黑暗躲猫猫
#以笑面对一切真的能解决问题
各位感兴趣的 tag 可以留言,我先写。把过去藏起来只会遗忘过去……
记录时间重点在高中以前。
yzqzss|一座桥在水上's Note
丑搜 https://uglysearch.othing.xyz 刚糊出来的中文独立博客搜索引擎。11万篇文章,1.4k+独立博客。(文章全文搜索) (没有搜索按钮,打字就行) demo 性质,不保可用性。
从加日志到现在,积累了 11031 条查询。网友都搜了些什么鬼东西……
数据库我一直懒得去更新,内容还是停留在几个月前。
数据库我一直懒得去更新,内容还是停留在几个月前。
昨天在爬一个网站的图,发现半年前还能满速下,现在下一会儿就会被 rate limit 到 2张/min 。
然而用浏览器访问,基本都不会触发 rate limit ,图片下载请求一分钟上百个也没问题。但一开脚本,有时候甚至只下4张图就会被限制。每请求间 sleep 20s 也不行。
也没发现什么隐蔽的鉴权。每下几张图,假装正常访问一次主站的页面,也不行。再假装成正常浏览网页,随机 3-20s 瞬发下载 10-30 张图,带上正常的 http headers,还是不行。
最后破案:
* 因为 api 默认是按文件名升序排序输出的。所以咱的爬虫也会一个一个地请求下载这些图片。
* 服务器识别到连续的升序文件名请求,就知道你是爬虫了,直接上超级 rate limit,才不管你什么 http2 、http header 。
太妙了。
然而用浏览器访问,基本都不会触发 rate limit ,图片下载请求一分钟上百个也没问题。但一开脚本,有时候甚至只下4张图就会被限制。每请求间 sleep 20s 也不行。
也没发现什么隐蔽的鉴权。每下几张图,假装正常访问一次主站的页面,也不行。再假装成正常浏览网页,随机 3-20s 瞬发下载 10-30 张图,带上正常的 http headers,还是不行。
最后破案:
* 因为 api 默认是按文件名升序排序输出的。所以咱的爬虫也会一个一个地请求下载这些图片。
* 服务器识别到连续的升序文件名请求,就知道你是爬虫了,直接上超级 rate limit,才不管你什么 http2 、http header 。
太妙了。